خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک
Authors
abstract
مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشهبندی در دنیای واقعی، اغلب با مجموعه دادههایی مواجهیم که از ترکیبی از مقادیر عددی و دستهای تشکیل شدهاند. در حالیکه اغلب روشهای خوشهبندی موجود تنها بر روی دادههای عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی دادههای مختلط را ندارند. از سوی دیگر، بیشتر روشهای سنتی، تعداد خوشهها را به عنوان ورودی از کاربر طلب میکنند. در حالیکه در بیشتر موارد تعداد خوشهها برای کاربر مقداری نامعلوم است و حدس زدن مقدار آن نیز به خصوص در مورد مجموعه دادههای بزرگ کاری مشکل و حتی غیرممکن است. در این مقاله قصد داریم تا با بهرهگیری از روشی دقیقتر جهت اندازهگیری فاصله میان مقادیر دستهای، روش جدیدی را برای خوشهبندی دادههای مختلط ارائه نماییم که نیازی به تعیین تعداد خوشهها به عنوان ورودی الگوریتم نداشته و قادر است همزمان با خوشهبندی داده ها، مقدار بهینه برای تعداد خوشهها را محاسبه نماید. در روش پیشنهادی معکوس شاخص davies-bouldin به عنوان تابع برازش در نظر گرفته شده و به منظور جستجوی فضای جواب از الگوریتم ژنتیک استفاده میشود. برای ارزیابی عملکرد الگوریتم از دو گروه از داده های استاندارد و شبیهسازی شده استفاده شده است. نتایج بدست آمده، عملکرد بسیار بالای الگوریتم پیشنهادی را نشان میدهد
similar resources
خوشهبندی خودکار دادههای مختلط با استفاده از الگوریتم ژنتیک
In the real world clustering problems, it is often encountered to perform cluster analysis on data sets with mixed numeric and categorical values. However, most existing clustering algorithms are only efficient for the numeric data rather than the mixed data set. In addition, traditional methods, for example, the K-means algorithm, usually ask the user to provide the number of clusters. In this...
full textیک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر
The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...
full textتعیین توصیفگرهای بهینه در خوشه بندی داده های لیدار با استفاده از الگوریتم ژنتیک
در سالهای اخیر، تکنولوژی لیدار به عنوان یک تکنولوژی کارآمد در کسب اطلاعات سهبعدی از زمین شناخته شده و هر روز بیش از پیش مورد توجه مهندسین و متخصصان مهندسی ژئوماتیک قرار میگیرد. استخراج عوارض از دادههای لیدار به عنوان یکی از مسائل مهم در پردازش این اطلاعات به شمار میآید. یکی از راههای استخراج اتوماتیک عوارض از این دادهها استفاده از الگوریتمهای خوشهبندی میباشد. تعیین روش بهینه خوشهبند...
full textجداسازی خودکار کانی های موجود در مقاطع نازک سنگ ها با استفاده از الگوریتم های پردازش تصویر و خوشه بندی
جداسازی خودکار کانی های موجود در مقاطع نازک با استفاده از روشهای پردازش تصویر، یکی از موضوعاتی است که در سالهای اخیر مورد توجه زمین شناسان قرار گرفته است. سنگها اصلیترین منبع اطلاعاتی زمین شناسان میباشند، و یکی از روشهای متداول مطالعه سنگها، تهیه مقاطع نازک از آنها و بررسی این مقاطع با استفاده از میکروسکوپ های انکساری قطبی کننده نور است. همچنین جداسازی کانی های موجود در مقاطع نازک،...
full textبررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی
Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...
full textبهینه سازی زمان بندی الگوریتم های موازی با استفاده از الگوریتم ژنتیک
In scheduling, a set of machines in parallel is a setting that is important, from both the theoretical and practical points of view. From the theoretical viewpoint, it is a generalization of the single machine scheduling problem. From the practical point of view the occurrence of resources in parallel is common in real-world. When machines are computers, a parallel program can be conceived as a...
full textMy Resources
Save resource for easier access later
Journal title:
بین المللی مهندسی صنایع و مدیریت تولیدجلد ۲۳، شماره ۲، صفحات ۱۸۷-۱۹۷
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023